[新サービス]S3上のデータをSQLクエリで取得する、Amazon Athenaを試す #reinvent
コンニチハ、千葉です。Amazon Athenaが発表されましたので、さっそく試してみました。これは、ほんとすごいです。
Amazon Athenaとは?
詳細はAWSの公式ブログAmazon Athena – Amazon S3上のデータに対話的にSQLクエリをに記載されていますのでこちらを参照ください。
Amazon Athenaについて、上公式ブログから引用です。
Athenaは新しいサーバレスクエリサービスで、Amazon S3に保存された膨大な量のデータを標準SQLを使って簡単に分析できます。シンプルにAmazon Simple Storage Service (S3)に保存したデータを指定し、フィールドを定義して、クエリを投げると、数秒で結果を得られます。皆さんは、クラスタや他のインフラを構築したり管理したりチューニングする必要はなく、実行したクエリに対してのみお金を払うだけでよいです。裏では、Athenaがクエリを並列化して何百、何千コアに分散してくれ、数秒で結果を届けてくれます。
引用元:Amazon Athena – Amazon S3上のデータに対話的にSQLクエリを
やってみた
クエリを投げてみた
Athenaにログインすると、サンプルデータとしてelb_logsというテーブルがあります。このデータはS3にあるようです。 試しに、このテーブルに対してクエリを投げてみました。
数秒で結果が返ってきます。これは、ほんとすごい。
よく使うクエリを登録してみた
よく使うクエリを登録して、何度も実行することができます。
Save Asを選択します。
保存名と説明を記載します。
あとは、Saved Queriesから確認できます。 リンクをクリックするとすぐ実行できます。
クエリのヒストリを確認する
過去実行したクエリを確認できます。ステータスや、クエリにかかった時間も確認できますね。
新しいデータベースやテーブルを作成する
新規にデータベースを作成してみます。
Saved Queriesをクリック。
データベース情報とS3のURLを入力。
フォーマットを入力。
カラムの設定。
オプションはそのままで。
作成できました!
他ツールとの連携
Quick SightやJDBCを利用できるということで、ドキュメントが公開されたようなので、やってみた系の他のブログで書きたいと思います!
最後に
Key Note 1日目、沢山の発表がありました。明日もあるので楽しみです!